home *** CD-ROM | disk | FTP | other *** search
/ Chip 2007 November / CPNL0711.ISO / admin / secure / Tor - Privoxy - Vidalia.exe / Privoxy / default.2.0.action < prev    next >
Text File  |  2006-11-04  |  44KB  |  1,236 lines

  1. ######################################################################
  2. #  File        :  $Source: /cvsroot/ijbswa/current/default.action.master,v $
  3. #  $Id: default.action.master,v 1.39 2006/10/24 10:53:55 hal9 Exp $
  4. #
  5. #  Requires    :  This version requires Privoxy v3.0.4 or later due to 
  6. #                 syntax changes.
  7. #
  8. #  Purpose     :  Default actions file, see
  9. #                 http://www.privoxy.org/user-manual/actions-file.html.
  10. #                 This file is subject to periodic updating. Local exceptions
  11. #                 and enhancements are better placed in user.action. 
  12. #
  13. #  Copyright   :  Written by and Copyright (C) 2001 - 2006 the
  14. #                 Privoxy team. http://www.privoxy.org/
  15. #
  16. #  Note: Updated versions of this file will be made available from time
  17. #        to time. Check http://sourceforge.net/project/showfiles.php?group_id=11118
  18. #        for updates and/or subscribe to the announce mailing list
  19. #        (http://lists.sourceforge.net/lists/listinfo/ijbswa-announce) if you
  20. #        wish to receive an email notice whenever updates are released.
  21. #
  22. # We value your feedback. However, to provide you with the best support,
  23. # please note:
  24. #  
  25. #  * Use the support forum to get help:
  26. #    http://sourceforge.net/tracker/?group_id=11118&atid=211118
  27. #  * Submit feedback for this actions file only through the 
  28. #    SF actions file feedback tracker: 
  29. #    http://sourceforge.net/tracker/?group_id=11118&atid=460288
  30. #  * Submit bugs only through our bug forum:
  31. #    http://sourceforge.net/tracker/?group_id=11118&atid=111118 
  32. #    Make sure that the bug has not already been submitted. Please try
  33. #    to verify that it is a Privoxy bug, and not a browser or site
  34. #    bug first. If you are using your own custom configuration, please
  35. #    try the stock configs to see if the problem is a configuration
  36. #    related bug. And if possible please try the latest CVS sources.
  37. #  * Submit feature requests only through our feature request forum:
  38. #    http://sourceforge.net/tracker/?atid=361118&group_id=11118&func=browse
  39. #      
  40. # For any other issues, feel free to use the mailing lists:
  41. # http://sourceforge.net/mail/?group_id=11118
  42. #    
  43. # Anyone interested in actively participating in development and related
  44. # discussions can join the appropriate mailing list here:
  45. # http://sourceforge.net/mail/?group_id=11118. Archives are available
  46. # here too. 
  47. #
  48. # The current development version of this file is located: 
  49. # http://ijbswa.cvs.sourceforge.net/*checkout*/ijbswa/current/default.action.master
  50. #############################################################################
  51. # Syntax
  52. #############################################################################
  53. # A much better explanation can be found in the user manual which is
  54. # part of the distribution and can be found at http://www.privoxy.org/user-manual
  55. #
  56. # To determine which actions apply to a request, the URL of the request is
  57. # compared to all patterns in this file. Every time it matches, the list of
  58. # applicable actions for this URL is incrementally updated. You can trace
  59. # this process by visiting http://config.privoxy.org/show-url-info
  60. #
  61. # There are 4 types of lines in this file: comments (like this line),
  62. # actions, aliases and patterns, all of which are explained below.
  63. #
  64. #############################################################################
  65. # Pattern Syntax
  66. #############################################################################
  67. # 1. On Domains and Paths
  68. # -----------------------
  69. #
  70. # Generally, a pattern has the form <domain>/<path>, where both the <domain>
  71. # and <path> part are optional. The pattern matching syntax is different for
  72. # each. If you only specify a domain part, the "/" can be left out, but it is
  73. # required for the path part.
  74. # www.example.com 
  75. #   is a domain-only pattern and will match any request to www.example.com
  76. # www.example.com/
  77. #   means exactly the same (but is slightly less efficient)
  78. # www.example.com/index.html
  79. #   matches only the document /index.html on www.example.com
  80. # /index.html
  81. #   matches the document /index.html, regardless of the domain
  82. # index.html
  83. #   matches nothing, since it would be interpreted as a domain name and
  84. #   there is no top-level domain called ".html".
  85. # 2. Domain Syntax
  86. # ----------------
  87. # The matching of the domain part offers some flexible options: If the
  88. # domain starts or ends with a dot, it becomes unanchored at that end:
  89. # www.example.com
  90. #   matches only www.example.com
  91. # .example.com
  92. #   matches any domain that ENDS in .example.com
  93. # www.
  94. #   matches any domain that STARTS with www.
  95. #
  96. # .example.
  97. #   matches any domain that CONTAINS example
  98. #
  99. # Additionally, there are wildcards that you can use in the domain names
  100. # themselves. They work pretty similar to shell wildcards: "*" stands for
  101. # zero or more arbitrary characters, "?" stands for one, and you can define
  102. # charachter classes in square brackets and they can be freely mixed:
  103. # ad*.example.com
  104. #   matches adserver.example.com, ads.example.com, etc but not sfads.example.com
  105. # *ad*.example.com
  106. #   matches all of the above
  107. # .?pix.com
  108. #   matches www.ipix.com, pictures.epix.com, a.b.c.d.e.upix.com etc
  109. # www[1-9a-ez].example.com
  110. #   matches www1.example.com, www4.example.com, wwwd.example.com, 
  111. #   wwwz.example.com etc, but not wwww.example.com
  112. # You get the idea?
  113. # 2. Path Syntax
  114. # --------------
  115. # Paths are specified as full regular expressions, and are more flexible than
  116. # the domain syntax above. A comprehensive discussion of regular expressions
  117. # wouldn't fit here.
  118. # Perl compatible regular expressions are used. See the pcre/docs/ direcory or
  119. # man perlre (also available at http://perldoc.perl.org/perlre.html) for
  120. # details. The appendix to our User Manual also has some detail.
  121. # Please note that matching in the path is CASE INSENSITIVE by default, but
  122. # you can switch to case sensitive by starting the pattern with the "(?-i)"
  123. # switch:
  124. # www.example.com/(?-i)PaTtErN.*
  125. #   will match only documents whose path starts with PaTtErN in exactly this
  126. #   capitalization.
  127. #
  128. # Partially case-sensetive and partially case-insensitive patterns are
  129. # possible, but the rules about splitting them up are extremely complex
  130. # - see the PCRE documentation for more information.
  131. #############################################################################
  132. # Action Syntax
  133. #############################################################################
  134. #
  135. # There are 3 kinds of actions:
  136. #
  137. # Boolean (e.g. "block"):
  138. #   +name  # enable
  139. #   -name  # disable
  140. #
  141. # Parameterized (e.g. "hide-user-agent"):
  142. #   +name{param}  # enable and set parameter to "param"
  143. #   -name         # disable
  144. #
  145. # Multi-value (e.g. "add-header", "send-wafer"):
  146. #   +name{param}  # enable and add parameter "param"
  147. #   -name{param}  # remove the parameter "param"
  148. #   -name         # disable totally
  149. #
  150. # The default (if you don't specify anything in this file) is not to take
  151. # any actions - i.e completely disabled, so Privoxy will just be a
  152. # normal, non-blocking, non-anonymizing proxy.  You must specifically
  153. # enable the privacy and blocking features you need (although the 
  154. # provided default actions file will do that for you).
  155. #
  156. # Later actions always override earlier ones.  For multi-valued actions,
  157. # the actions are applied in the order they are specified.
  158. #
  159. #############################################################################
  160. # Valid actions are:
  161. #############################################################################
  162. #
  163. # +add-header{Name: value}
  164. #    Adds the specified HTTP header, which is not checked for validity.
  165. #    You may specify this many times to specify many headers.
  166. #
  167. # +block
  168. #    Block this URL. Privoxy will ignore this URL completely, and not request
  169. #    it.
  170. #
  171. # +content-type-overwrite
  172. #    Replaces the "Content-Type:" HTTP server header, so that unwanted
  173. #    download menus will not pop up, or changes the browser's rendering mode.
  174. #
  175. # +crunch-client-header{string}
  176. #    Deletes every header sent by the client that contains the string the 
  177. #    user supplied as parameter. 
  178. #    
  179. # +crunch-if-none-match
  180. #     Deletes the "If-None-Match:" HTTP client header. 
  181. #
  182. # +crunch-server-header{string}
  183. #    Deletes every header sent by the server that contains the string the 
  184. #    user supplied as a parameter. 
  185. # +deanimate-gifs{last}
  186. # +deanimate-gifs{first}
  187. #    Deanimate all animated GIF images, i.e. reduce them to their last
  188. #    frame. This will also shrink the images considerably. (In bytes,
  189. #    not pixels!) 
  190. #    If the option "first" is given, the first frame of the animation
  191. #    is used as the replacement. If "last" is given, the last frame of
  192. #    the animation is used instead, which propably makes more sense for
  193. #    most banner animations, but also has the risk of not showing the
  194. #    entire last frame (if it is only a delta to an earlier frame).
  195. #
  196. # +downgrade-http-version
  197. #    Downgrade HTTP/1.1 client requests to HTTP/1.0 and downgrade the
  198. #    responses as well. Use this action for servers that use HTTP/1.1
  199. #    protocol features that Privoxy currently can't handle yet.
  200. #
  201. # +fast-redirects{check-decoded-url}
  202. # +fast-redirects{simple-check}
  203. #    Many sites, like yahoo.com, don't just link to other sites.
  204. #    Instead, they will link to some script on their own server,
  205. #    giving the destination as a parameter, which will then redirect
  206. #    you to the final target. 
  207. #
  208. #    URLs resulting from this scheme typically look like:
  209. #    http://some.place/some_script?http://some.where-else
  210. #
  211. #    Sometimes, there are even multiple consecutive redirects encoded
  212. #    in the URL. These redirections via scripts make your web browing
  213. #    more traceable, since the server from which you follow such a link
  214. #    can see where you go to. Apart from that, valuable bandwidth and
  215. #    time is wasted, while your browser aks the server for one redirect
  216. #    after the other. Plus, it feeds the advertisers.
  217. #
  218. #    The +fast-redirects{check-decoded-url} option enables interception of 
  219. #    these requests by Privoxy, who will cut off all but the last valid URL 
  220. #    in the request and send a local redirect back to your browser without
  221. #    contacting the intermediate sites. NOTE: Syntax change as of v.3.0.4.
  222. #
  223. # +filter{name}
  224. #    All files of text-based type, most notably HTML and JavaScript, to which
  225. #    this action applies, can be filtered on-the-fly through the specified
  226. #    regular expression based substitutions. (Note: plain text documents are
  227. #    exempted from filtering, because web servers often use the text/plain
  228. #    MIME type for all files whose type they don't know.) By default,
  229. #    filtering works only on the raw document content itself (that which can
  230. #    be seen with View Source), not the headers. Repeat for multiple filters.
  231. #    Use with caution: filters can be very intrusive.
  232. #   
  233. #    Filters predefined in the supplied default.action include:
  234. #
  235. #     js-annoyances:         Get rid of particularly annoying JavaScript abuse
  236. #     js-events:             Kill all JS event bindings (Radically destructive! Use only on real suckers)
  237. #     html-annoyances:       Get rid of particularly annoying HTML abuse
  238. #     content-cookies:       Kill cookies that come in the HTML or JS content
  239. #     refresh-tags:          Kill automatic refresh tags (for dial-on-demand setups)
  240. #     unsolicited-popups:    Disable only unsolicited pop-up windows
  241. #     all-popups:            Kill all popups in JavaScript and HTML
  242. #     img-reorder:           Reorder attributes in <img> tags to make the banners-by-* filters more effective
  243. #     banners-by-size:       Kill banners by size (very efficient!)
  244. #     banners-by-link:       Kill banners by their links to known clicktrackers 
  245. #     webbugs:               Squish WebBugs (1x1 invisible GIFs used for user tracking)
  246. #     tiny-textforms:        Extend those tiny textareas up to 40x80 and kill the hard wrap
  247. #     jumping-windows:       Prevent windows from resizing and moving themselves
  248. #     frameset-borders:      Give frames a border
  249. #     demoronizer:           Fix MS's non-standard use of standard charsets
  250. #     shockwave-flash:       Kill embedded Shockwave Flash objects
  251. #     quicktime-kioskmode:   Make Quicktime movies saveable
  252. #     fun:                   Text replacements  for subversive browsing fun!
  253. #     crude-parental:        Kill all web pages that contain the words "sex" or "warez"
  254. #     ie-exploits:           Disable some known Internet Explorer bug exploits
  255. #     site-specifics:        Cure for site-specific problems. Don't apply generally!
  256. #     google:                Removes text ads and other Google specific improvements
  257. #     yahoo:                 Removes text ads and other Yahoo specific improvements
  258. #     msn:                   Removes text ads and other MSN specific improvements
  259. #     blogspot:              Cleans up Blogspot blogs
  260. #     html-to-xml:           Header filter to change the Content-Type from html to xml
  261. #     xml-to-html:           Header filter to change the Content-Type from xml to html
  262. #     no-ping:               Removes non-standard ping attributes from anchor and area tags
  263. #     hide-tor-exit-notation: Header filter to remove the Tor exit node notation in Host and Referer headers
  264. #
  265. # +filter-client-headers
  266. #    By default, filters only apply to the document content itself. This will
  267. #    extend those filters to include the client's headers as well.
  268. #
  269. # +filter-server-headers
  270. #    By default, filters only apply to the document content itself. This will
  271. #    extend those filters to include the server's headers as well.
  272. #
  273. # +force-text-mode
  274. #    Declares a document as plain text, even if the "Content-Type:" isn't detected 
  275. #    as such. 
  276. #
  277. # +handle-as-empty-document
  278. #   This action alone doesn't do anything noticeable. It just marks URLs. If
  279. #   the block action also applies, the presence or absence of this mark
  280. #   decides whether an HTML "blocked"  page, or an empty document will be sent
  281. #   to the client as a substitute for the blocked content.
  282. #
  283. # +hide-accept-language{lang}
  284. # +hide-accept-language{block}
  285. #   Deletes or replaces the "Accept-Language:" HTTP header in client
  286. #   requests.
  287. #
  288. # +hide-content-disposition{block}
  289. # +hide-content-disposition{string}
  290. #   Deletes or replaces the "Content-Disposition:" HTTP header set by some 
  291. #   servers. This can be used to prevent download menus for content you 
  292. #   prefer to view inside the browser, for example.
  293. #
  294. # +hide-forwarded-for-headers
  295. #   Block any existing X-Forwarded-for header, and do not add a new one.
  296. #
  297. # +hide-from-header{block}
  298. # +hide-from-header{spam@sittingduck.xqq}
  299. #   If the browser sends a "From:" header containing your e-mail address, 
  300. #   either completely removes the header ("block"), or change it to the
  301. #   specified e-mail address.
  302. #
  303. # +hide-if-modified-since{block}
  304. # +hide-if-modified-since{-1}
  305. #   Deletes the "If-Modified-Since:" HTTP client header or modifies its 
  306. #   value, preventing another way to track users.
  307. #
  308. # +hide-referer{block}
  309. # +hide-referer{forge}
  310. # +hide-referer{http://nowhere.com}
  311. #    Don't send the "Referer:" (sic) header to the web site.  You can
  312. #    block it, forge a URL to the same server as the request (which is
  313. #    preferred because some sites will not send images otherwise) or
  314. #    set it to a constant string.
  315. #
  316. # +hide-referrer{...}
  317. #    Alternative spelling of +hide-referer.  Has the same parameters,
  318. #    and can be freely mixed with, "+hide-referer".  ("referrer" is the 
  319. #    correct English spelling, however the HTTP specification has a 
  320. #    bug - it requires it to be spelt "referer").
  321. #
  322. # +hide-user-agent{browser-type}
  323. #    Change the "User-Agent:" header so web servers can't tell your
  324. #    browser type.  (Breaks many web sites).  Specify the user-agent
  325. #    value you want - e.g., to pretend to be using Netscape on Linux:
  326. #      +hide-user-agent{Mozilla (X11; I; Linux 2.0.32 i586)}
  327. #    Or to identify yourself explicitly as a Privoxy user:
  328. #      +hide-user-agent{Privoxy/1.0}
  329. #    (Don't change the version number from 1.0 - after all, why tell them?)
  330. #
  331. # +handle-as-image
  332. #    Treat this URL as an image.  This only matters if it's also "+block"ed,
  333. #    in which case a "blocked" image can be sent rather than a HTML page.
  334. #    See +set-image-blocker{} for the control over what is actually sent.
  335. #
  336. # +inspect-jpegs
  337. #    Scan jpeg headers for malformed comment blocks and correct them.
  338. #
  339. # +set-image-blocker{blank}
  340. # +set-image-blocker{pattern}
  341. # +set-image-blocker{<URL>} with <url> being any valid image URL
  342. #    Decides what to do with URLs that end up tagged with {+block +handle-as-image}.
  343. #    There are 4 options:
  344. #      * "-set-image-blocker" will send a HTML "blocked" page, usually
  345. #         resulting in a "broken image" icon.
  346. #      * "+set-image-blocker{blank}" will send a 1x1 transparent image
  347. #      * "+set-image-blocker{pattern}" will send a 4x4 grey/white pattern
  348. #        which is less intrusive than the logo but easier to recognize
  349. #        than the transparent one.
  350. #      * "+set-image-blocker{<URL>}" will send a HTTP temporary redirect
  351. #        to the specified image URL.
  352. #
  353. #
  354. # +limit-connect{portlist}
  355. #   The CONNECT methods exists in HTTP to allow access to secure websites
  356. #   (https:// URLs) through proxies. It works very simply: The proxy
  357. #   connects to the server on the specified port, and then short-circuits
  358. #   its connections to the cliant and to the remote proxy.
  359. #   This can be a big security hole, since CONNECT-enabled proxies can
  360. #   be abused as TCP relays very easily.
  361. #   By default, i.e. in the absence of a +limit-connect action, Privoxy
  362. #   will only allow CONNECT requests to port 443, which is the standard port
  363. #   for https.
  364. #   If you want to allow CONNECT for more ports than that, or want to forbid
  365. #   CONNECT altogether, you can specify a comma separated list of ports and port
  366. #   ranges (the latter using dashes, with the minimum defaulting to 0 and max to 65K):
  367. #
  368. #   +limit-connect{443} # This is the default and need no be specified.
  369. #   +limit-connect{80,443} # Ports 80 and 443 are OK.
  370. #   +limit-connect{-3, 7, 20-100, 500-} # Port less than 3, 7, 20 to 100, and above 500 are OK.
  371. #
  372. # +overwrite-last-modified{block}
  373. # +overwrite-last-modified{reset-to-request-time}
  374. # +overwrite-last-modified{randomize}
  375. #    Removing the "Last-Modified:" header is useful for filter testing, where
  376. #    you want to force a real reload instead of getting status code "304",
  377. #    which would cause the browser to reuse the old version of the page.
  378. #
  379. #    The "randomize" option overwrites the value of the "Last-Modified:"
  380. #    header with a randomly chosen time between the original value and the
  381. #    current time. In theory the server could send each document with a
  382. #    different "Last-Modified:" header to track visits without using cookies.
  383. #    "Randomize" makes it impossible and the browser can still revalidate
  384. #    cached documents.
  385. #
  386. #    "reset-to-request-time" overwrites the value of the "Last-Modified:"
  387. #    header with the current time. You could use this option together with
  388. #    hided-if-modified-since to further customize your random range. 
  389. #  
  390. # +prevent-compression
  391. #    Prevent the website from compressing the data. Some websites do
  392. #    that, which is a problem for Privoxy, since +filter, +kill-popups
  393. #    and +gif-deanimate will not work on compressed data. Will slow down
  394. #    connections to those websites, though.
  395. #
  396. # +prevent-keeping-cookies
  397. # +session-cookies-only
  398. #    If the website sets cookies, make sure they are erased when you exit
  399. #    and restart your web browser.  This makes profiling cookies useless,
  400. #    but won't break sites which require cookies so that you can log in
  401. #    or for transactions.
  402. #
  403. # +crunch-outgoing-cookies
  404. #    Prevent the website from reading cookies
  405. #
  406. # +crunch-incoming-cookies
  407. #    Prevent the website from setting cookies
  408. #
  409. # +kill-popups (deprecated)
  410. #    Filter the website through a built-in filter to disable
  411. #    window.open() etc.  The two alternative spellings are
  412. #    equivalent.
  413. #
  414. # +redirect{<URL>}
  415. #    Convinces the browser that the requested document has been moved to
  416. #    another location and the browser should get it from the specified
  417. #    URL.
  418. #
  419. # +send-vanilla-wafer
  420. #    This action only applies if you are using a jarfile.  It sends a
  421. #    cookie to every site stating that you do not accept any copyright
  422. #    on cookies sent to you, and asking them not to track you.  Of
  423. #    course, this is a (relatively) unique header they could use to 
  424. #    track you.
  425. #
  426. # +send-wafer{name=value}
  427. #    This allows you to add an arbitrary cookie.  Specify it multiple
  428. #    times in order to add several cookies.
  429. #
  430. # +treat-forbidden-connects-like-blocks
  431. #    If this action is enabled, Privoxy no longer makes a difference between
  432. #    forbidden connects and ordinary blocks. 
  433. #
  434. #    By default Privoxy answers forbidden "Connect" requests  with a short
  435. #    error message inside the headers. If the browser doesn't display headers
  436. #    (most don't), you just see an empty page. With this action enabled,
  437. #    Privoxy displays the message that is used for ordinary blocks instead. If
  438. #    you decide to make an exception for the page in question, you can do so
  439. #    by following the "See why" link. 
  440. #
  441. #############################################################################
  442.  
  443. #############################################################################
  444. # Settings -- Don't change.
  445. #############################################################################
  446. {{settings}}
  447. #############################################################################
  448. for-privoxy-version=3.0.5
  449.  
  450. #############################################################################
  451. # Aliases
  452. #############################################################################
  453. {{alias}}
  454. #############################################################################
  455. #
  456. # You can define a short form for a list of permissions - e.g., instead
  457. # of "-crunch-incoming-cookies -crunch-outgoing-cookies -filter -fast-redirects",
  458. # you can just write "shop". This is called an alias.
  459. #
  460. # Currently, an alias can contain any character except space, tab, '=', '{'
  461. # or '}'.
  462. # But please use only 'a'-'z', '0'-'9', '+', and '-'.
  463. #
  464. # Alias names are not case sensitive.
  465. #
  466. # Aliases beginning with '+' or '-' may be used for system action names 
  467. # in future releases - so try to avoid alias names like this.  (e.g. 
  468. # "+crunch-all-cookies" below is not a good name)
  469. #
  470. # Aliases must be defined before they are used.
  471.  
  472. # These aliases just save typing later:
  473. #
  474. +crunch-all-cookies = +crunch-incoming-cookies +crunch-outgoing-cookies
  475. -crunch-all-cookies = -crunch-incoming-cookies -crunch-outgoing-cookies
  476.  allow-all-cookies  = -crunch-all-cookies -session-cookies-only 
  477.  allow-popups       = -filter{all-popups} -kill-popups -filter{unsolicited-popups}
  478. +block-as-image     = +block +handle-as-image
  479. -block-as-image     = -block
  480.  
  481. # These aliases define combinations of actions
  482. # that are useful for certain types of sites:
  483. #
  484. fragile     = -block -crunch-all-cookies -filter -fast-redirects -hide-referer -kill-popups -prevent-compression
  485. shop        = -crunch-all-cookies allow-popups
  486.  
  487. # Your favourite blend of filters:
  488. #
  489. myfilters   = +filter{html-annoyances} +filter{js-annoyances} +filter{all-popups}\
  490.               +filter{webbugs} +filter{nimda} +filter{banners-by-size} #+filter{fun}
  491.  
  492. # Allow ads for selected useful free sites:
  493. #
  494. allow-ads   = -block -filter{banners-by-size} -filter{banners-by-link}
  495.  
  496. #############################################################################
  497. # Defaults
  498. #############################################################################
  499. { \
  500. -add-header \
  501. -block \
  502. -content-type-overwrite \
  503. -crunch-client-header \
  504. -crunch-if-none-match \
  505. -crunch-outgoing-cookies \
  506. -crunch-incoming-cookies \
  507. -crunch-server-header \
  508. -deanimate-gifs \
  509. -downgrade-http-version \
  510. -fast-redirects \
  511. -filter{js-annoyances} \
  512. -filter{js-events} \
  513. -filter{html-annoyances} \
  514. -filter{content-cookies} \
  515. -filter{refresh-tags} \
  516. -filter{unsolicited-popups} \
  517. -filter{all-popups} \
  518. -filter{img-reorder} \
  519. -filter{banners-by-size} \
  520. -filter{banners-by-link} \
  521. -filter{webbugs} \
  522. -filter{tiny-textforms} \
  523. -filter{jumping-windows} \
  524. -filter{frameset-borders} \
  525. -filter{demoronizer} \
  526. -filter{shockwave-flash} \
  527. -filter{quicktime-kioskmode} \
  528. -filter{fun} \
  529. -filter{crude-parental} \
  530. -filter{ie-exploits} \
  531. -filter{site-specifics} \
  532. -filter{google} \
  533. -filter{yahoo} \
  534. -filter{msn} \
  535. -filter{blogspot} \
  536. -filter{xml-to-html} \
  537. -filter{html-to-xml} \
  538. -filter{no-ping} \
  539. -filter{hide-tor-exit-notation} \
  540. -filter-client-headers \
  541. -filter-server-headers \
  542. -force-text-mode \
  543. -handle-as-empty-document \
  544. -handle-as-image \
  545. -hide-accept-language \
  546. -hide-content-disposition \
  547. -hide-if-modified-since \
  548. +hide-forwarded-for-headers \
  549. +hide-from-header{block} \
  550. -hide-referrer \
  551. -hide-user-agent \
  552. -inspect-jpegs \
  553. -kill-popups \
  554. -limit-connect \
  555. -prevent-compression \
  556. -overwrite-last-modified \
  557. -redirect \
  558. -send-vanilla-wafer \
  559. -send-wafer \
  560. -session-cookies-only \
  561. +set-image-blocker{pattern} \
  562. -treat-forbidden-connects-like-blocks \
  563. }
  564. / # Match all URLs
  565.  
  566. #############################################################################
  567. # These extensions belong to images:
  568. #############################################################################
  569. {+handle-as-image -filter}
  570. #############################################################################
  571. /.*\.(gif|jpe?g|png|bmp|ico)($|\?)
  572.  
  573. #############################################################################
  574. # These don't:
  575. #############################################################################
  576. {-handle-as-image}
  577. /.*\.(js|php|css|.?html?)
  578.  
  579. #############################################################################
  580. # Generic block patterns by host:
  581. #############################################################################
  582. {+block}
  583. ad*.
  584. .*ads.
  585. .ad.
  586. .*advert*.
  587. *banner*.
  588. count*.
  589. *counter.
  590. promotions.
  591.  
  592. #############################################################################
  593. # Generic unblockers by host:
  594. #############################################################################
  595. {-block}
  596. adsl.
  597. ad[udmw]*.
  598. adbl*.
  599. adam*.
  600. adob*.
  601. adrenaline.
  602. adtp*.
  603. adv[oia]*.
  604. .*road*.
  605. .olympiad*.
  606. .*load*.
  607. .*[epu]ad*.
  608. county*.
  609. countr*.
  610.  
  611. #############################################################################
  612. # Generic block patterns by path:
  613. #############################################################################
  614. {+block}
  615. /(.*/)?ad(\?|/|s|v|_?(image|se?rv|box)|cycle|rotate|mentor|click|f[ra]m|script|stream|fetch|log|space)
  616. /.*ads(new)?/
  617. /(.*/)?(ad|all|nn|db|promo(tion)?)?[-_]?banner
  618. /(.*/)?(publicite|werbung|reklaa?m|annonse|maino(kset|nta|s)?/)
  619. /.*(count|track|compteur|adframe|adse?rve?|banner)(er|run)?(\?|\.(pl|cgi|exe|dll|asp|php|cpt))
  620. /(.*/)?clicktrack
  621.  
  622. #############################################################################
  623. # Generic unblockers by path:
  624. #############################################################################
  625. {-block}
  626. /.*ad(sl|v(i[cs]|o|an|ertencia|ent|.*search)) # advice/advisories/advan*/advertencia (spanish)
  627. /.*(lo|thre|he|d|gr|l|ro|re|squ)ads
  628. /.*account
  629. support./(.*/)?track
  630.  
  631. #############################################################################
  632. # Exceptions for academia
  633. #############################################################################
  634. .edu
  635. .ac.*/
  636. .uni-*.de
  637. .tu-*.de
  638. .gov
  639. .hs-*.de 
  640. .fh-*.de
  641.  
  642. #############################################################################
  643. # Catch-all for false-positives that are just TOO obvious to let go
  644. #############################################################################
  645. {+block}
  646. .ads[erv][rv]*.
  647. .ads.
  648. /(.*/)?ad(se?rv|click|stream|image)
  649.  
  650. #############################################################################
  651. # Site-specific block patterns;
  652. #############################################################################
  653. .hitbox.com 
  654. .the-gadgeteer.com/cgi-bin/getimage.cgi/
  655. dest.travelocity.com/website/destinations/images/partner_frommers.gif
  656. dest.travelocity.com/website/destinations/images/travelex_logo.gif
  657. i.imdb.com/Photos/CMSIcons/(?!buttons|emoticons)
  658. rcm.amazon.com
  659. .nytimes.com/adx/
  660. #www.popupad.net/ats/
  661. .adtrak.net 
  662. .elitemediagroup.net
  663. .popuptraffic.com
  664. .hit-now.com
  665. [a-v]*.valueclick.com
  666. .cpays.com
  667. .oxado.com
  668. .adultfriendfinder.com
  669. /scripts/cms/xcms.asp
  670. /.*intellitxt/
  671. .intellitxt.com
  672. .klipmart.com
  673. ad*.com.com
  674. dw.com.com
  675. sales.liveperson.net
  676. .iad.liveperson.net
  677. data.coremetrics.com/cm
  678. .realmedia.com/data/
  679. .revsci.net
  680. .clickability.com
  681. /.*clickability(.com)?/
  682. stats.*.ihost.com
  683. .2o7.net
  684. .webtrends.com
  685. .tacoda.
  686. .ign.com
  687. ad.theadhost.com
  688. .adbureau.net
  689. .adgardener.com
  690. .revenue.net
  691. .geocities.com/js_source
  692.  
  693. #----------------------------------------------------------------------------
  694. # Misc Junk.
  695. #----------------------------------------------------------------------------
  696. {+block +handle-as-empty-document}
  697. /b/ss/.+
  698. /HG\?hc=
  699. .visistat.com
  700. .google-analytics.
  701. .overture.
  702. .doubleclick.net/adi
  703. .doubleclick.net/(.*/)?adj/
  704. view.atdmt.com/(.*/)?iview/
  705. tracking.
  706. /(.*/)?adjs\.php\?
  707.  
  708. #----------------------------------------------------------------------------
  709. # JavaScripts for ad and popup generation
  710. #----------------------------------------------------------------------------
  711. pagead*.googlesyndication./.*\.js
  712. /js\.ng/
  713. /popunder
  714.  
  715. #############################################################################
  716. # Generic block-as-image patterns:
  717. #############################################################################
  718. {+block-as-image}
  719. /.*ad_?image\.(php|cgi)
  720. /.*recips?/
  721. /bandeaux/
  722. /.*client_?ad\.(php|cgi)
  723. /.*AIM_UAC.adp
  724.  
  725. #############################################################################
  726. # Site-specific block-as-image patterns:
  727. #############################################################################
  728. #----------------------------------------------------------------------------
  729. # Banner farms:
  730. #----------------------------------------------------------------------------
  731. ?r.atwola.com 
  732. .[a-vx-z]*.doubleclick.net/(?!(.*/)?ad[ji])
  733. .*servedby.advertising.com
  734. .a.yimg.com/(?:(?!/i/).)*$
  735. .a[0-9].yimg.com/(?:(?!/i/).)*$
  736. .yimg.com/(.*/)?a/
  737. .yimg.com/.*/(flash|java)/promotions
  738. .yimg.com/a/.*/flash/
  739. bs*.gsanet.com
  740. bs*.einets.com
  741. .qkimg.net
  742. [a-vx-z]*.atdmt.com/
  743. .fastclick.net
  744. .casalemedia.com
  745. kermit.macnn.com/
  746. quinst.com/images
  747. valuepage.com/images
  748. ia.imdb.com/.*\.swf
  749. .reactivpub.
  750. .as*.falkag.
  751. a.tribalfusion.com/
  752. .adserver.com/
  753. .ru4.com/
  754. www.smartadserver.com/
  755. admedia.
  756. jmcms.cydoor.com/
  757. .adtrix.com
  758. *[0-9].tribalfusion.com/
  759. img.mediaplex.com
  760. a*farm.mediaplex.com
  761. view.atdmt.com
  762. matrix.mediavantage.
  763. .cibleclick.com
  764. .netracker.net
  765. .interclick.com
  766. .maxserving.com
  767. .gonamic.de
  768. .webads.
  769. .adlegend.com
  770. .belnk.com
  771. .euros4click.
  772. ads-*.quarterserver.
  773. searchportal.information.com/
  774. images.ibsys.com/
  775.  
  776. #----------------------------------------------------------------------------
  777. # Cross-site user tracking
  778. #----------------------------------------------------------------------------
  779. .*.*.spylog.com/
  780. statse.webtrendslive.com
  781. spinbox.versiontracker.com/.*\.(gif|jpg)
  782. stat.onestat.com
  783. .[a-vx-z]*.tradedoubler.com
  784. stat.webmedia.
  785. log*.xiti.com/
  786. log*.hit-parade.com/
  787. www.xml.eshop.msn.com/tracksponsorimpression.asp
  788. #stats.surfaid.ihost.com/(crc/)?images/(bounce/)?uc.GIF
  789. stats./c?rc/.*/uc.gif
  790. .imrworldwide.com
  791. .clicktracks.com
  792. .etracker.
  793. .x-traceur.com
  794. content.ipro.com
  795. .247realmedia.com
  796. .sify.com
  797. .searchignite.com
  798. .statcounter.com
  799. .research-int.se/data
  800. .cybermonitor.com
  801. /(.*/)?c(lear)?\.gif\?.
  802. #/(.*/)?(clear|(trans_?1x|blank)?1).gif
  803. /(.*/)?(clear|blank|(trans_?|1x)?1).gif\?.+
  804. log.go.com/log
  805. stats.indextools.com
  806. /.*/dcs.gif\?&?dcs
  807. /__utm.gif\?
  808.  
  809. #----------------------------------------------------------------------------
  810. # Specific counters (see above for generic patterns)
  811. #----------------------------------------------------------------------------
  812. s*.sitemeter.com/meter
  813. fastcounter.bcentral.com/
  814. bilbo.counted.com/
  815. #[a-z][0-9].nedstatbasic.net/
  816.  
  817. #----------------------------------------------------------------------------
  818. # On-site ads and other single sources:
  819. #----------------------------------------------------------------------------
  820. .travelocity./Sponsor_gifs/
  821. .weather.com/creatives/
  822. .weather.com/web/services/email/
  823. /.*/topslots/topslot
  824. .contextweb.com/
  825. .offermatica.com/
  826. .adbrite.com
  827. .jpost.com/images/\d+/promos/
  828. .infoempleo.com/(pop-up|images(/Nueva/|/motor))
  829. hera.hardocp.com/
  830. leadback.advertising.
  831. .yieldmanager.com/
  832. .displayadsmedia.com
  833. astalavista.box.sk/adult.*\.jpg
  834. smartad.*.*.*
  835. .bc.yahoo.com/b\?P=
  836. .dinside.no/annonsorer/
  837. /RealMedia/ads/
  838.  
  839. #############################################################################
  840. # Site-specific unblockers:
  841. #############################################################################
  842. {-block}
  843. .faqs.org/banner\.html
  844. bannerblind.mozdev.org
  845. advogato.org
  846. ad*.vhb.de
  847. .globalintersec.com/adv
  848. banners.wunderground.com/
  849. .openoffice.org/banners/
  850. .amazon.com/.*/banners/
  851. .washingtonpost.com/wp-srv/
  852. .gnome.org
  853. .nycsubway.org/img/banner
  854. .forgotten-ny.com/ADS/
  855. counter.li.org
  856. adrian.adrian.org
  857. adela.karlin.mff.cuni.cz
  858. .swcp.com/rtoads/
  859. .privoxy.org
  860. sourceforge.net/.*tracker
  861. .brawnylads.com
  862. adzapper.
  863. .altavista.com/web/adv
  864. rads.mcafee.com/
  865. linuxfromscratch.org/
  866. dv411.com/.*advc50
  867. .freeswan.org/
  868. www.arm.com/.*ads
  869. www.anybrowser.org/
  870. www.tads.org/
  871. .mbe.com/redir/packtrack.asp
  872. .iship.com/trackit/
  873. .esis.com.au/AdvSerialCards
  874. .familysearch.org/.*banner
  875. coder.com/creations/banner/
  876. arnolds.dhs.org/static/adv_tools.html
  877. .gpl.org/
  878. .europa.eu.
  879. .schooner.com/~loverso/no-ads/
  880. source.bungie.org/
  881. adonthell.linuxgames.com/
  882. .bbc.co.uk/
  883. adc.netlabs.org/
  884. .tela.bc.ca/tads/
  885. adbusters.org/
  886. .eads.*/
  887. .qualcomm.com/brew/developer/resources/ad/
  888. /update/.*adsnt.*
  889. .microsoft.com/.*masthead
  890. .indymedia.org
  891. .seanbaby.com
  892. cels.org/.*track
  893. .nic.ad.jp
  894. /(.*/)?somerights20.gif
  895. .creativecommons.org
  896. .ups.com/.*/track
  897. .adju.
  898. .rubberslug.com
  899. .freebsd.org
  900. adiumx.com
  901. .googleadservices./pagead/adclick
  902. .garaget.org/annonser/
  903. edge.macworld.com
  904. .discovery./.*/topads/
  905. .dawn.com/.*/(9690dina|aurora_award)\.
  906.  
  907. #############################################################################
  908. # Site-specific special rules:
  909. #############################################################################
  910.  
  911. #----------------------------------------------------------------------------
  912. # These sites are very complex (read: keen on your identity) and require
  913. # minimal interference.
  914. #----------------------------------------------------------------------------
  915. {fragile}
  916. .office.microsoft.com
  917. .windowsupdate.microsoft.com
  918. # too broad: .apple.com
  919. www.apple.com
  920. store.apple.com
  921. images.apple.com
  922. .update.microsoft.com
  923. mail.google.
  924.  
  925. #----------------------------------------------------------------------------
  926. # Semi-fragile, allow for blocks.
  927. #----------------------------------------------------------------------------
  928. { -crunch-all-cookies -filter -fast-redirects -hide-referer -kill-popups -prevent-compression }
  929. .yahoo.com
  930.  
  931. #----------------------------------------------------------------------------
  932. # Shopping and banking sites - allow cookies and pop-ups
  933. #----------------------------------------------------------------------------
  934. {shop}
  935. .quietpc.com
  936. .worldpay.com   # for quietpc.com
  937. .jungle.com
  938. .dabs.com
  939. .overclockers.co.uk
  940. .db24.de
  941. .ebay.
  942. .mobile.de
  943. www.fondationlejeu.com
  944. www.techtv.com
  945. .mywebgrocer.com
  946.  
  947. #----------------------------------------------------------------------------
  948. # Subscription sites (with credible privacy policy) - allow permanent cookies
  949. #----------------------------------------------------------------------------
  950. {-session-cookies-only}
  951. .nytimes.com/
  952. .volkskrant.nl/
  953.  
  954. #----------------------------------------------------------------------------
  955. # These sites require pop-ups, so don't use the unconditional filters.
  956. #----------------------------------------------------------------------------
  957. {allow-popups}
  958. www.aprilbarrows.com/discography\.html$
  959. .nvidia.com
  960. www*.chathouse.com/games/
  961. .bild.t-online.de
  962. .netflix.com
  963. my.aol.com
  964. i.cnn.net/cnn/.*/clickability/button
  965. .rosettaproject.org
  966. .quantum.com
  967.  
  968.  
  969. #----------------------------------------------------------------------------
  970. # Sometimes (i.e. often!) fast-redirects catches things by mistake
  971. #----------------------------------------------------------------------------
  972. {-fast-redirects}
  973. www.ukc.ac.uk/cgi-bin/wac\.cgi\?
  974. .google.
  975. .altavista.com/(.*(like|url|link):|trans.*urltext=)http
  976. .speedfind.de
  977. .nytimes.com
  978. .yahoo.com/.*done=
  979. .w3.org
  980. .directhit.com
  981. .zagats.com
  982. my.msn.com/passport/pp(consent|set)\.ashx\?msnru=
  983. www.passport.com/Consumer/default\.asp\?lc=[0-9]+&msppchlg=[01]&mspplogin=
  984. login.passport.com/logout\.(asp|srf)\?
  985. download.com.com/redir\?
  986. www.fileplanet.com/redir\.asp\?
  987. web.archive.org
  988. .edu
  989. .archive.org
  990. www.guenstiger.de
  991. .anonymizer.com
  992. www.mailtothefuture.com
  993. support.microsoft.com/
  994. .alexa.com
  995. www.translate.ru/url/
  996. schneegans.de/
  997. config.privoxy.org/
  998.  
  999. #----------------------------------------------------------------------------
  1000. # No filtering for sourcecode or other automatically parsed content
  1001. #----------------------------------------------------------------------------
  1002. {-filter -prevent-compression}
  1003. cvs.
  1004. /.*(cvs(view|web)|viewcvs)
  1005. svn.
  1006. websvn.
  1007. /(.*/)?svn/
  1008. liveupdate.symantec.com
  1009. liveupdate.liveupdatesymantec.com
  1010. liveupdate.symantecliveupdate.com
  1011. .bookmarklets.com
  1012. .squarefree.com/bookmarklets/
  1013. swquery.apple.com
  1014. swscan.apple.com
  1015. .speakeasy.net/\d+k
  1016. .debian.org
  1017. bugzilla.
  1018. .tldp.org
  1019. webmail.
  1020. .wiki*.
  1021. .*wiki.
  1022. /.*wiki/
  1023. maps.google.
  1024. .google.com/calendar
  1025. code.
  1026. developer.
  1027. .mozdev.org
  1028. .mozilla.org
  1029. .perl.org
  1030. .cpan.org
  1031. .webdeveloper.com
  1032. .ibm.com/developerworks
  1033. .apache.org/docs
  1034. .comptechdoc.org
  1035. .webmonkey.com
  1036. .webreference.com
  1037. docs.sun.com
  1038. java.sun.com
  1039. .thescripts.com
  1040. .php.net
  1041. .phpdeveloper.org
  1042. .oreillynet.com/pub
  1043. .devshed.com
  1044. .htmlgoodies.com
  1045. .javascript.com
  1046. javascript.internet.com
  1047. .w3schools.com
  1048. .devguru.com
  1049. javascriptkit.com
  1050. .xulplanet.com
  1051. .perl.com/language/newdocs
  1052. .freebsd.org
  1053. .watson.org
  1054. .netbsd.org
  1055. .openbsd.org
  1056. .dragonflybsd.org
  1057. .freedesktop.org
  1058. /(.*/)?flyspray/
  1059. /(.*/)?mail(man|archive|inglists?)/
  1060. bugs.
  1061. quoka.de
  1062.  
  1063. #----------------------------------------------------------------------------
  1064. # These sites suffer from a bug in PHP < 4.2.3 (ob_gzhandler broken;
  1065. # workaround is to use zlib.output_compression):
  1066. # (Section obsolete as of Privoxy 3.0.3, which has workaround)
  1067. #----------------------------------------------------------------------------
  1068. #{-prevent-compression}
  1069. # Surely this is rectified by now 09/16/06 ???
  1070. #www.powie.de
  1071. #www.phpcenter.de
  1072. #www.timeanddate.com
  1073. #.pclinuxonline.com
  1074. #.dungeoncrawl.org
  1075. #www.digitalspy.co.uk
  1076. #www.audio-illumination.org/forums/
  1077. #www.catchword.com
  1078. #www.ubernet.org
  1079. #www.ooodocs.org
  1080. #www.ntcompatible.com
  1081. #.winehq.com
  1082. #.dotcomtod.de/
  1083. #.tweakers.net
  1084. #.troublesathome.nl
  1085. #.art.softshape.com
  1086.  
  1087. #----------------------------------------------------------------------------
  1088. # Innocent images in standard banner sizes found here:
  1089. #----------------------------------------------------------------------------
  1090. {-filter{banners-by-size}}
  1091. .pricegrabber.com/search_getprod.php
  1092. .cnn.com
  1093. .gamespot.com/gamespot
  1094. www.wral.com
  1095. .cartoonnetwork.com/
  1096. .anybrowser.org
  1097. images.google.
  1098. .pbs.org/.*/roadshow/
  1099. objects.povworld.org/cat/
  1100. www.xach.com/gimp/
  1101. .mapquest.com/directions/
  1102. .theonion.com/content/
  1103. .pattilupone.net/gallery.html
  1104. .ambrosiasw.com/
  1105. .microsoft.com
  1106. javabog.dk/ijk/
  1107. .w3.org
  1108.  
  1109. #----------------------------------------------------------------------------
  1110. # These don't work without the referrer information:
  1111. #----------------------------------------------------------------------------
  1112. {-hide-referrer}
  1113. .totaleclips.com
  1114. .mandrakelinux.com/en/ftp.php3
  1115. validator.w3.org/check\?uri=referer
  1116. .petitiononline.com/mod_perl/signed.cgi
  1117. .telia.se
  1118.  
  1119. #----------------------------------------------------------------------------
  1120. # These animated gifs are either useful or nice:
  1121. #----------------------------------------------------------------------------
  1122. {-deanimate-gifs}
  1123. .care2.com
  1124. .care-mail.com
  1125. .wunderground.com
  1126. 66.28.250.180/data/
  1127. .teamquest.com/gifs/gunther/
  1128. .rubberslug.com
  1129.  
  1130. #----------------------------------------------------------------------------
  1131. # These sites are so abusive that we need to kill all JS event bindings (and
  1132. # probably a break a lot along the way)
  1133. #----------------------------------------------------------------------------
  1134. #{+filter{js-radical}}
  1135. ##MASTER# PROBLEM-URL: http://www.planetspiele.de/
  1136. #.planetspiele.de
  1137. #216.12.219.40
  1138.  
  1139. #----------------------------------------------------------------------------
  1140. # The "site-specifics" filter has special cures for problems found here:
  1141. #----------------------------------------------------------------------------
  1142. {+filter{site-specifics} +prevent-compression}
  1143. .spiegel.de/static/js/flash-plugin\.js
  1144. .quelle-bausparkasse.de/$
  1145. .groups.yahoo.com/group/
  1146. #MASTER PROBLEM-URL: http://www.nytimes.com/
  1147. .nytimes.com/
  1148.  
  1149. #----------------------------------------------------------------------------
  1150. # Content under these TLDs is most probably in character sets which the
  1151. # demoronizer filter would mess up
  1152. #----------------------------------------------------------------------------
  1153. {-filter{demoronizer}}
  1154. .jp
  1155. .cn
  1156. .tw
  1157. .ru
  1158. .kr
  1159.  
  1160. #----------------------------------------------------------------------------
  1161. # Misc special rules:
  1162. #----------------------------------------------------------------------------
  1163. {-filter{content-cookies} -filter{webbugs}}
  1164. .friendscout24.de
  1165. .webreference.com/js/column8/property.html
  1166.  
  1167. {-filter{fun}}
  1168. /(.*/)?user-manual/filter-file.html
  1169.  
  1170. #{+filter{img-reorder} +filter{banners-by-link}}
  1171. ##MASTER# PROBLEM-URL: http://www.dn.se/
  1172. ##MASTER# REMARKS: Can't catch by size or location
  1173. #www.dn.se
  1174.  
  1175. {-filter{img-reorder}}
  1176. .google.
  1177. /.*wired(\.com)?/
  1178. .wired.com/
  1179.  
  1180. {-filter{js-annoyances}}
  1181. .nasa.gov
  1182. .cnrs.fr 
  1183. blogs.msdn.com
  1184.  
  1185. {-filter{unsolicited-popups}}
  1186. /.*mt.cgi$
  1187. .cnrs.fr 
  1188. blogs.msdn.com
  1189.  
  1190. {+fast-redirects{check-decoded-url} -block}
  1191. .*rd.yahoo.com/
  1192.  
  1193. {+block}
  1194. /antitheft\.php
  1195.  
  1196. {+filter{tiny-textforms} +prevent-compression}
  1197. .sourceforge.net/tracker
  1198.  
  1199. {+downgrade-http-version}
  1200. :631
  1201.  
  1202. #{ -crunch-outgoing-cookies \
  1203. #  -crunch-incoming-cookies \
  1204. #  +session-cookies-only \
  1205. #}
  1206. #www.versiontracker.com/
  1207.